Méthodes à noyaux appliquées aux textes structurés
نویسندگان
چکیده
Résumé. Cet article ébauche un état de l’art sur l’utilisation des noyaux pour le traitement des données structurées. Les applications modernes de la fouille de données sont de plus en plus confrontés à des données structurées, notamment textuelles. Les algorithmes d’apprentissage doivent donc être capables de tirer parti des informations apportées par la structure, ce qui pose d’intéressants problèmes de représentation des données. L’une des approches possibles consiste à utiliser les noyaux de Mercer. Ces noyaux permettent de calculer la similarité entre deux données de type quelconque, et peuvent être utilisés par une large gamme d’algorithmes d’apprentissage (Machines à Vecteur de Support, ACP, Analyse Discriminante, Perceptron, etc). Nous présentons dans cet article les principaux noyaux proposés ces dernières années pour le traitement des structures telles que les séquences, les arbres et les graphes.
منابع مشابه
Sélection de modèles par des méthodes à noyaux pour la classification de données séquentielles
Ce travail concerne le développement de méthodes de classification discriminantes pour des données séquentielles. Quelques techniques ont été proposées pour étendre aux séquences les méthodes discriminantes, comme les machines à vecteurs supports, par nature plus adaptées aux données en dimension fixe. Elles permettent de classifier des séquences complètes mais pas de réaliser la segmentation, ...
متن کاملApprentissage de métrique appliqué à la classification de textes par méthodes à noyaux
Résumé – Dans cet article, nous proposons une méthode pour l’optimisation de la métrique d’un classifieur textuel à noyaux. Contrairement aux techniques populaires existantes, notre approche ne nécessite pas la définition explicite de règles sémantiques. Etant donné un ensemble d’apprentissage, l’algorithme proposé permet d’optimiser la matrice sémantique, sans qu’il soit nécessaire d’exhiber c...
متن کاملRégularisation de noyaux temporellement élastiques et analyse en composantes principales non-linéaire pour la fouille de séries temporelles
Résumé. Dans le domaine de la fouille de séries temporelles, plusieurs travaux récents exploitent des noyaux construits à partir de distances élastiques de type Dynamic Time Warping (DTW) au sein d’approches à base de noyaux. Pourtant les matrices, apparentées aux matrices de Gram, construites à partir de ces noyaux n’ont pas toujours les propriétés requises ce qui peut les rendre in fine impro...
متن کاملIndices de formes et de textures. Application au classement de noyaux de cellules
RÉSUMÉ. Cet article présente une étude sur le diagnostic de noyaux de cellules sanguines provenant de patients atteints de Progéria. Les noyaux sont caractérisés à l’aide de différentes méthodes d’analyse de forme et de texture, puis classés par des techniques d’apprentissage. Les mesures extraites des noyaux servent aux calculs d’un ensemble de valeurs nommées des « indices ». Les indices sont...
متن کاملUtilisation de sous-systèmes bien contraints pour le filtrage de CSP numériques
Quand les méthodes par intervalles sont appliquées aux systèmes d’équations sur les réels, deux principaux types de filtrage sont utilisés pour réduire l’espace de recherche. Quand le système est carré, l’algorithme de Newton sur intervalles se comporte comme une contrainte globale sur tout le système n×n. D’autre part, les algorithmes de filtrage, provenant de la programmation par contraintes,...
متن کامل